NumPy是python的一個重要模組,主要用在資料分析,支援大量的高階維度陣列與矩陣運算,NumPy 底層以 C 和 Fortran 語言開發,因此運算效能狠狠碾壓python的列表運算,當今絕大部分S級資料分析套件(Pandas、SciPy、Scikit-learn、matplotlib),都跟NumPy脫離不了關係,因此為了學習其他資料科學相關套件,我們必須在NumPy上打好堅實的基礎。
請在終端機底下輸入這個,謝謝pip install numpy
像這樣
import numpy as np
np是世俗公認的numpy簡稱,如果要使用其他numpy的別名,請三思而後行
相較於python的list,他們最大的差別就是list能夠儲存不同資料型態的資料,而NumPy陣列只能儲存相同的資料型態,但效能帶來的極致體驗,還是讓NumPy在處理大量資料中獨霸一方,陣列操作可以說是NumPy招牌,其特色為同質且支援多重維度的ndarray
物件,這個物件的三個重要屬性分別為:
維度(ndim)
形狀(shape)
資料型態(dtype)
一般我們稱一維陣列為vector而二維陣列為matrix,使用方法如下
# 載入numpy模組
import numpy as np
if __name__ == "__main__":
# 以列表來建立numpy陣列
l1 = [12, 14, 0, 5, 23]
a1 = np.array(l1)
l2 = [17, -5, 28, 5, 6]
a2 = np.array(l2)
# 陣列相加
print(a1 + a2)
# [29 9 28 10 29]
# 顯示重要屬性
print(a1.ndim)
# 1 => 一維陣列
print(a1.shape)
# (5,) => 五個元素
print(a1.dtype)
# int64 => 資料型態
# 存取資料
print(a1[3])
# 5 # 載入numpy模組
import numpy as np
if __name__ == "__main__":
# 以列表來建立numpy陣列
l1 = [12, 14, 0, 5, 23]
a1 = np.array(l1)
l2 = [17, -5, 28, 5, 6]
a2 = np.array(l2)
# 陣列相加
print(a1 + a2)
# [29 9 28 10 29]
# 顯示重要屬性
print(a1.ndim)
# 1 => 一維陣列
print(a1.shape)
# (5,) => 五個元素
print(a1.dtype)
# int64 => 資料型態
import numpy as np
if __name__ == "__main__":
# 以列表來建立numpy陣列
l1 = [12, 14, 0, 5, 23, 3]
a1 = np.array(l1)
print(a1)
# [12, 14, 0, 5, 23, 3]
# 顯示重要屬性
print(a1.ndim)
# 1 => 一維陣列
print(a1.shape)
# (6,) => 六個元素
print(a1.dtype)
# int64 => 資料型態
# 維度轉換
a1 = a1.reshape([2, 3])
print(a1)
# [[12 14 0] [ 5 23 3]]
# 顯示重要屬性
print(a1.ndim)
# 2 => 二維陣列
print(a1.shape)
# (2, 3) => 2*3個元素
print(a1.dtype)
# int64 => 資料型態
import numpy as np
if __name__ == "__main__":
# 以列表來建立numpy陣列
l1 = [12, 14, 0, 5, 23, 3]
a1 = np.array(l1)
print(a1)
# [12, 14, 0, 5, 23, 3]
print(a1.dtype)
# int64 => 資料型態
# 轉換資料型態
a1 = a1.astype("float32")
print(a1)
# [12. 14. 0. 5. 23. 3.]
print(a1.dtype)
# float32 => 資料型態
import numpy as np
if __name__ == "__main__":
# 以列表來建立numpy陣列
l1 = [12, 14, 0, 5, 23, 3]
a1 = np.array(l1)
print(a1)
# [12, 14, 0, 5, 23, 3]
print(a1[0:3])
# 從第0個開始取,取到第3個之後不取
# [12 14 0]
print(a1[4:6])
# 從第4個開始取,取到第6個之後不取
# [23 3]
import numpy as np
if __name__ == "__main__":
# 以列表來建立numpy陣列
l1 = [12, 14, 0, 5, 23, 3]
a1 = np.array(l1)
print(a1)
# [12, 14, 0, 5, 23, 3]
# 用布林遮罩來過濾資料
mask = a1 % 2 == 0
print(mask)
# [ True True True False False False]
print(a1[mask])
# [12 14 0]